#AI 基礎設施
輝達NemoClaw將至:不止是AI智能體,更是企業級全端基礎設施革命
距離GTC 2026大會(3月16日)就剩下1天了,整個AI技術圈都在盼望著輝達的重磅行動——根據好多方面的爆料還有官方前瞻資訊,NemoClaw的企業級AI智能體開源平台,將會正式露面。作為技術開發者、我們更關心的不是“又一款智能體工具問世”,而是這款產品能否解決我們在AI落地中最頭疼的痛點:硬體繫結、技術堆疊碎片化、安全合規缺失、規模化部署困難。從最近公佈的技術細節以及行業前沿情況出發,今天我們從技術角度,預先拆解NemoClaw的核心價值、技術架構,還有它將會給企業AI落地帶來的變化。02 先破後立:NemoClaw與OpenClaw,根本不在一個技術維度在聊NemoClaw之前,先弄清楚一個認識:它和現在熱門的OpenClaw其實是完全不同層面的產品,這也是技術人員最該關注的核心區別。OpenClaw的定位是:個人開發者級的Agent執行框架,核心解決“讓大模型能幹活”的問題。它的技術邊界很清晰:接收指令、拆解任務、呼叫工具、返回結果,本質是“應用層工具”。底層的模型部署、推理最佳化、硬體調度、安全管控,技術團隊全都要自己整合起來。恰恰是這種開放性,埋下了安全隱患——Meta曾出於安全考慮,叫停員工使用OpenClaw。NemoClaw的定位是:企業級AI智能體全生命周期基礎設施——它並非從零開發的全新產品,是將輝達已有的NeMo技術堆疊、NIM推理微服務等成熟技術進行系統性重構與增強,補齊企業級多Agent協作、安全治理、硬體相容等短板,形成從硬體到應用的全端閉環。用技術人的話來說:OpenClaw是“單點工具”,NemoClaw是“平台級底座”;OpenClaw解決“Agent能不能用”,NemoClaw解決“企業能不能規模化、安全、合規地用Agent”。結合輝達現有技術生態,NemoClaw主要整合了以下5大核心組成部分(均基於輝達成熟技術進行企業級增強),每一部分都對應企業AI落地的一個核心環節:核心基礎:NeMo技術堆疊(輝達已有的模型訓練微調體系),作為NemoClaw的模型層核心,提供模型管理、量化、版本控制等能力,也是Nemotron3系列模型的承載基礎;推理核心:NIM推理微服務(輝達成熟的推理部署工具),經過深度重構後把CUDA依賴給去掉了,變成了NemoClaw推理層的核心,負責模型推理還有算力調度,也是實現硬體中立的關鍵;Agent執行:按照輝達現有的Agent編排邏輯,整合最佳化之後弄出個Supervisor+Worker多Agent架構,負責任務拆解、協作還有執行,把企業級多Agent調度能力給補上;安全治理:把輝達企業級安全元件(像資料加密、容器隔離技術這類)整合起來,再結合合規管控邏輯,弄出個內建的安全治理模組,解決企業Agent失控、資料洩露的隱患;硬體適配:靠著輝達多硬體調度介面來最佳化,能相容NVIDIA、AMD、Intel這些主流的AI加速器,打破CUDA繫結,適配企業現有的硬體基礎設施,不用額外換裝置。我們通過每個層級的對比表格,就能弄明白兩者在維度上的不一樣OpenClaw只關注Agent執行,別的全都得依靠外部;而NemoClaw涵蓋從硬體到應用的整個全鏈路。企業技術團隊不用再去拼湊好多套技術堆疊,一套NemoClaw就能把AI智能體落地的整個全流程給搞定。03 技術拆解:NemoClaw的3個核心突破結合最近公佈的技術細節,NemoClaw的核心技術設計是下面這3點,值得重點關注:突破1:打破CUDA繫結,達成全硬體相容NemoClaw最有顛覆性的技術設計就是輝達第一次在核心產品裡做到硬體無關性(Hardware-Agnostic),對於那些已經大量用AMD或Intel硬體的團隊來說,那就相當於是要承受比較高的遷移成本。NemoClaw的突破在於:硬體層:原生支援NVIDIA、AMD、Intel及主流AI加速器,甚至相容自研晶片;調度層:裡面有多個硬體適配引擎,能自動最佳化不同硬體的推理性能,不用技術團隊手動去改程式碼、調參數;部署層:支援本地伺服器、私有雲、邊緣裝置等多種部署環境,資料可全程本地化,完美適配金融、醫療等強監管行業的需求。從技術實現的角度來說,NemoClaw的核心就是對輝達現有的NIM推理微服務進行深度重構,把CUDA依賴給去掉了,還最佳化了硬體調度介面,與此同時完整保留著輝達在推理最佳化方面的核心優勢。突破2:全端整合,終結“技術堆疊碎片化”難題對於企業技術團隊來說,部署AI智能體的最大痛點,不是“不會做”,而是“整合難”——要整合模型訓練微調工具、推理引擎、Agent編排框架、工具集、安全元件,每一步都需要大量的定製開發和相容性測試,耗時耗力且易出現故障。NemoClaw的核心優勢在於“系統性重構與增強”:它把輝達現有的成熟技術(NeMo技術堆疊、NIM推理微服務等)進行模組化封裝、做相容性最佳化,不是簡單地拼接。技術團隊可以根據需要呼叫、靈活擴展,不用從零開始搭建(技術團隊只需要掌握基礎Docker、K8s部署能力,就能快速上手,不用深入去瞭解NeMo底層架構):模型層:內建Nemotron3系列(含Nano、Super、Ultra版本)。據DeepTech深科技報導,Nano版本支援100萬Token超長上下文,採用Mamba-MoE混合架構;Super版定位更高性能,參數量達百億級規模。推理層:基於NIM推理微服務做企業級最佳化,據早期測試者反饋,視訊記憶體效率較裸跑vLLM有顯著提升,解決高並行場景下的性能瓶頸。編排層:用Supervisor+Worker多Agent架構,能支援任務拆解和協作,有可視化拖曳編排介面,不用寫好多程式碼;與此同時還支援任務快取、平行執行,提高效率。工具方面:裡面有內建的Agent通用工具集合(像郵件處理、資料查詢之類的),支援自己弄工具接進來,還能提供同步或者非同步呼叫還有權限管理,防止出現超權限操作。更重要的是,這些模組都是用標準化介面設計的,能單獨最佳化、替換——比如說企業可以留著自己的模型推理引擎,就只用NemoClaw來做Agent編排,對現有技術體系沒有侵入性,大大降低改造成本。突破3:內建企業級安全,解決“Agent失控焦慮”企業搞AI落地,安全一直都是底線——尤其是金融、醫療這些受嚴格監管的行業,Agent的超權限操作、資料洩露、操作沒追溯這些問題,是技術團隊最發愁的隱患。而OpenClaw這類消費級智能體框架,安全只是個附加的東西,技術團隊另外去整合第三方元件,相容性還不好保證。NemoClaw將安全與治理作為核心元件,從底層設計就融入了企業級安全能力:多層防護體系:裡面有AES-256資料加密、MFA身份驗證、Docker容器沙箱隔離,嚴格限制智能體訪問範圍,避開超權限操作;完整的審計追蹤:即時記錄操作的軌跡,能支援日誌查詢和追溯,目標是符合SOC2、ISO27001、GDPR等企業合規標準(按照輝達安全戰略方向),用來應對監管檢查;風險熔斷機制:它有內建的毫秒級風險預判以及緊急停止能力,能防止資料洩露、系統故障;多租戶權限管控:支援RBAC權限模型(就是基於角色來分級管理權限,能適配企業裡多個團隊一起協作),能實現資源隔離、權限分級,適合大規模管理。04 核心價值:NemoClaw的核心價值就是省事、提高效率、不踩坑作為始終專注AI落地的技術人員,我們很明白:企業所需要的不是那種“顯擺技術”的AI工具,而是“能用、好用、安全、可控”的技術基礎。NemoCla的價值就在這裡——它不是對現有AI智能體技術的簡單升級,而是對企業AI落地模式的重新建構。對於技術團隊而言,它的核心價值有兩點:第一:降低技術門檻,減少重複開發:不用再去整合模型、推理、編排、安全等好幾套技術堆疊,也不用操心硬體相容性的事兒,一個平台就能把AI智能體的建構、部署、監控、最佳化全流程給做完,讓技術團隊從“重複的整合工作”裡解脫出來,專心去適配業務場景。第二:提升落地效率,降低試錯成本:有模組化設計、可視化編排、開箱就能用的場景範本,讓AI智能體的部署周期從“數月”變成“數天”;硬體是中立的,企業不用換現有的硬體,安全合規的能力也不用額外開發,大大降低投入成本。另外,NemoClaw打算用Apache2.0開源協議(結合輝達以前的開源策略,這是最有可能的協議,兼顧企業商用和二次開發),支援私有化部署、深度定製,不讓自己被廠商繫結;與此同時據WIRED報導,輝達打算用“貢獻換早期訪問”的模式,企業能通過貢獻程式碼得到定製化能力,一起打造開源生態。05 劃重點:要留意的3個技術問題儘管NemoClaw的核心技術細節慢慢被透露出來,不過作為技術人員需要關注GTC2026發佈會上的3個關鍵問題,關係到它能不能落地的重要因素:程式碼開源協議是什麼?是否包含閉源元件?Apache2.0允許商用閉源,GPL有傳染性,直接影響企業選型。需要確認開放原始碼的是全部程式碼還是僅部分模組。會不會出跨硬體(AMD\Intel)的標準化基準測試指令碼,讓企業自己去驗證?光看宣傳資料不夠,企業需要能在自己的硬體上跑出可信的性能資料,有指令碼才能真實驗證。審計日誌是否支援匯出至企業現有SIEM系統(如Splunk、QRadar)?金融等行業必須對接現有安全體系,光有內建日誌不夠,可整合性才是關鍵。06 一點理解:AI智能體的“企業級時代”要來了從技術演進的角度來看,NemoClaw的出現標誌著AI智能體從“個人消費級”向“企業生產級”的正式跨越——它不再是開發者的“玩具”,而是企業數位化轉型的“核心工具”。對於技術人員而言,NemoClaw的到來既是機遇也是挑戰。機遇在於它為我們提供了一套標準化、全端化的企業AI落地底座,讓我們能更高效地實現技術落地;挑戰在於我們需要快速熟悉其技術架構、模組化設計,結合企業業務場景,做好定製化適配和最佳化。下周一GTC 2026大會將正式開幕,NemoClaw的完整技術細節、開源計畫、合作生態將全面揭曉。作為技術人我們不妨保持期待,後續我們將第一時間跟進NemoClaw的發佈細節,拆解其技術架構、測試部署流程,分享技術落地經驗,歡迎技術同行關注、交流,一起探索企業AI智能體的未來。 (AI學習的楊同學)
黃仁勳發表署名文章:AI的“五層蛋糕”
AI正在成為現代世界的基礎設施。年度AI產業盛會輝達GTC大會將於下周舉行。值此之際,輝達分享了輝達創始人兼CEO黃仁勳發表的最新署名文章:《AI的“五層蛋糕”》,深度剖析了當前AI產業的核心架構,值得品讀。全文如下:AI是塑造當今世界的強大力量之一。它並非僅僅是一款巧妙的應用程式,也不是單一的模型,而是如同電力和網際網路一樣必不可少的基礎設施。AI依託真實的硬體、能源和經濟體系運行。它可以將原材料大規模地轉化為智能。每家公司都將應用AI, 每個國家或地區都將發展AI。要理解AI為何以這種方式發展,我們需要從基本原理進行推理,並瞭解計算領域發生了那些根本性變化。01. 從預製軟體到即時智能在計算技術發展的歷史中,軟體通常都是預先製作好的。人類描述一種演算法,電腦執行此操作。資料必須經過精心設計,儲存在表格中,並通過精確查詢進行檢索。SQL變得不可或缺,因為過去的世界因此得以運轉。AI打破了這種模式。我們首次擁有了一台能夠理解非結構化資訊的電腦。它能夠識別圖像、閱讀文字、聆聽聲音並理解其含義。它可以根據上下文和意圖進行推理。最重要的是,它能夠即時生成智能。每個回應都是全新建立的。每個答案都取決於你提供的上下文。這並非軟體檢索儲存的指令,而是軟體根據需求進行推理並生成智能。由於智能是即時生成的,因此其背後的整個計算架構都必須重新設計。02. AI即基礎設施從工業角度審視AI,其架構可分解為五層。最底層是能源。即時生成的智能需要即時產生的電力支援。每一個生成的token,都是電子流動、熱量管理以及能量轉化為計算的結果。在這一層面之下,沒有抽象層。能源是AI基礎設施的首要原則,也是制約系統能產生多少智能的瓶頸因素。▲能源能源層之上是晶片。這些處理器旨在大規模地將能源高效轉化為計算能力。AI工作負載需要巨大的平行處理能力、高頻寬記憶體和快速互連。晶片層的進展決定了 AI的擴展速度以及智能的可適用性。▲晶片晶片之上是基礎設施層。這包括土地、供電、冷卻系統、建築工程、網路通訊,以及將成千上萬處理器編排到一台機器的系統。這些系統就是AI工廠。它們的設計目的並非儲存資訊,而是製造智能。▲基礎設施基礎設施層之上是模型層。AI模型能夠理解多種類型的資訊:語言、生物學、化學、物理學、金融學、醫學以及物理世界本身。語言模型只是其中一個類別。一些最具變革性的工作正發生在蛋白質AI、化學AI、物理模擬、機器人技術和自主系統等領域。▲模型最上層是應用層,經濟價值在此產生,比如藥物研發平台、工業機器人、法律助手、自動駕駛汽車等。自動駕駛汽車是AI機器應用的具體表現。人形機器人則是AI具身應用的具體表現。同樣的架構,能帶來不同的成果。▲應用這就是五層蛋糕架構:能源→晶片→基礎設施→模型→應用。每一個成功的應用都會拉動其下的每一層,直至維持其運行的動力裝置。我們才剛剛開始這一建設處理程序,目前已投入數千億美元,但仍需建設價值數兆美元的基礎設施。放眼全球,我們看到晶片工廠、電腦組裝廠和AI工廠正在以前所未有的規模建設。這正在成為人類歷史上規模最大的基礎設施建設。支撐這一建設處理程序所需的人力非常龐大。AI工廠需要電工、管道工、管件工、鋼鐵工人、網路技術人員、安裝人員和操作員等。這些都是技術性強、待遇優厚的工作崗位,且目前供不應求。參與這場變革無需擁有電腦科學博士學位。與此同時,AI正在提高整個知識經濟領域的生產力。以放射學為例,AI已經能夠輔助解讀掃描影像,但對放射科醫生的需求仍在持續增長。這並非矛盾現象。放射科醫生的職責就是照顧患者,而解讀掃描影像只是其工作中的一個環節。當AI承擔更多的常規工作時,放射科醫生可以專注於判斷、溝通和護理。醫院的工作效率將越來越高,將能夠為更多的患者提供服務,也會僱傭更多員工。生產力提升創造產能,產能擴大推動增長。03. 過去一年的變化在過去的一年裡,AI跨越了一個重要的門檻。模型性能顯著提升,可以大規模投入使用。推理能力增強,幻覺現象減少,落地應用能力大幅提升。基於AI建構的應用首次開始創造真實的經濟價值。藥物研發、物流、客戶服務、軟體開發和製造領域的應用已經展現出強大的產品市場契合度。這些應用會對其下方的每一層架構都產生強勁的拉動效應。開源模型在這方面發揮著關鍵作用。全球大多數模型都是免費開放的。研究人員、初創公司、企業甚至國家都依靠開放模型來參與先進的AI。當開放模型達到前沿水平時,它們改變的不僅僅是軟體領域,而是啟動了整個技術堆疊的需求。DeepSeek-R1就是一個很好的例子。通過廣泛開放強大的推理模型,它加速了應用層的普及,並帶動了底層對訓練、基礎設施、晶片和能源的需求增長。04. 題中要義當你將AI視為必不可少的基礎設施時,其影響便顯而易見。AI始於Transformer大語言模型。但其意義遠不止於此。這是一場工業變革,重塑著能源的生產與消耗方式、工廠的建造模式、工作的組織形式以及經濟的增長路徑。如今,AI工廠正在興建,因為智能已實現即時生成。晶片正在被重新設計,因為效率決定了智能的擴展速度。能源成為核心要素,因為它從根本上決定了智能的生產規模上限。應用加速發展,因為底層模型已跨越門檻,得以大規模投入使用。每一層都相互強化。正因如此,AI建設規模才如此龐大,它才能夠同時觸及眾多行業,並不會侷限於單一國家、地區或單一領域。每家公司都將使用AI,每個國家都將發展AI。我們仍處於早期階段。大部分基礎設施尚未建成,大部分勞動力尚未接受培訓,大部分機遇尚未得到發掘。但方向已然明確。AI正在成為現代世界的基礎設施。而我們此刻的選擇、建構速度、參與廣度以及如何負責任地部署它將決定這個時代走向何方。 (芯東西)
56個超火“養龍蝦”玩法,快把你的AI牛馬用起來
“龍蝦”成了新時代“牛馬”。智東西3月11日報導,“小龍蝦”OpenClaw火爆出圈,ClawDocs網站以及GitHub的“awesome-openclaw-usecases”項目,彙集了經驗證的56個OpenClaw真實應用案例,從刷“油管”、管項目、修Bug,到盯盤炒幣、管智能家居……這只“小龍蝦”幾乎無所不能。▲ClawDocs首頁開發者的熱情不僅點燃了開源社區,也迅速吸引了科技巨頭的目光。 僅昨天一天,騰訊、字節跳動、螞蟻旗下支付寶三家國內大廠就官宣了5項OpenClaw相關服務。國內騰訊、百度、阿里巴巴、字節跳動、美團、京東、小米、華為、榮耀等大廠,海外Google、輝達等科技大廠全都陸續發佈了OpenClaw相關業務,開起了“小龍蝦養殖場”。截至3月10日中午12點,“小龍蝦”OpenClaw的GitHub星標數量已經達到29萬個。“養龍蝦”具體都可以做什麼?智東西梳理了社交媒體、內容生產、開發營運、生產力提升、日常生活、金融交易等六大領域,共56個已經成型了的OpenClaw應用案例,一起來看看。詳情連結:https://github.com/hesamsheikh/awesome-openclaw-usecases?tab=readme-ov-filehttps://clawdocs.org/guides/use-cases/01. 社交媒體篇:精準篩選內容,生成精選簡報在資訊爆炸的時代,每天面對海量的社交媒體內容,我們該如何高效獲取真正有價值的資訊?OpenClaw可以用來定製智能資訊篩選工具。1、每日Reddit精選:根據使用者興趣自動瀏覽Reddit類股,生成分類精選摘要並定時推送,還能記憶使用者偏好最佳化內容。2、每日YouTube精選:自動抓取訂閱YouTube頻道新視訊,提煉核心觀點生成簡報,已升級為獨立產品Recapio。▲Recapio首頁3、多源科技新聞精選:從109+資訊源匯聚科技資訊,去重評分後推送,30秒即可定製專屬資訊源。02. 內容創意生產篇:AI自動化流水線,降低創作成本對於內容創作者來說,從挖掘選題到最終發佈,每一個環節都耗費著大量精力。OpenClaw可以自訂為智能創作工具,將創作者從繁瑣的重複工作中解放出來,更加專注創意生產。1、YouTube內容選題:自動掃描AI資訊推送選題、規避重複內容,還能根據Slack連結生成帶大綱的任務卡片。2、多智能體內容工廠:串聯AI智能體完成選題、寫作、封面設計全流程,適配多種內容形式且可控成本。3、自動化遊戲開發:AI自主管理遊戲開發與維護,優先修復漏洞,平均7分鐘產出一款新遊戲或完成漏洞修復。4、播客幕後工作助手:為播客主完成調研、筆記、推廣文案等工作,解放創意創作時間。5、內容監控生產:自動監控競品部落格更新,生成摘要和推文並定時發佈,每周可節省15小時工作量。6、短影片內容生產:將長視訊剪輯適配各短影片平台,生成文案和話題標籤並自動分發,解放創作者精力。7、X帳號分析:抓取X平台使用者近期推文,解答營運疑問、分析爆款規律,可生成專屬分析指令碼。03. 基礎設施和開發營運:24小時智能維運,8天修復10個月未解決Bug在軟體開發領域,OpenClaw將AI從輔助工具升級為開發夥伴,功能覆蓋程式設計、偵錯、維運等幾乎全部環節。1、n8n工作流編排:作為AI與API的安全中介軟體,隔離憑證、可視化偵錯,降低安全風險和資源浪費。2、自修復主伺服器:7×24小時監控家庭伺服器,自動檢測修復故障,還能完成簡報、郵件整理等維運工作。3、“Patch”多智能體開發協調員:通過手機指令調動AI程式設計團隊協同工作,24小時線上且成本低於初級開發者日薪。4、Bug修復:8天修復10個月未解決的機器人故障,最佳化提示詞並修復API整合問題,節省人工時間。5、手機端遠端編碼:開發者可通過手機Telegram傳送指令,AI遠端執行程式碼修復、測試等操作,實現移動開發。6、自動診斷:自動檢測線上服務故障,生成診斷報告並推送開發者,甚至直接生成修復程式碼。7、CI/CD流水線監控與依賴項掃描器:監控程式碼建構測試狀態,掃描過時依賴並行送警報,保障程式碼質量。8、拉取請求審查機器人:私密傳送程式碼審查意見,規避公開點評的尷尬,提升審查效率。04. 生產力提升:化身數字員工,多Agent流水線跟蹤項目在生產力方面,OpenClaw搖身一變成了全能數字員工,可以應用在企業管理、AI客服與個人效率等領域。1、自動項目管理:多AI智能體協同工作,通過共享檔案同步進度,實現去中心化項目管理且全程可追溯。2、多管道AI客服:整合多管道客戶消息,AI自動回覆常規諮詢,複雜問題轉人工,大幅提升響應效率。3、目標管理:根據使用者目標,每日生成可自主執行的任務並跟蹤進度,助力目標落地。4、自動整理收件箱:自動處理積壓郵件,退訂垃圾郵件、分類歸檔,記憶處理規則持續最佳化。5、客戶管理晨報:周一會議前自動生成客戶報告、處理髮票,同步日曆,助力高效開會。6、“Reef”全端知識流水線:每日執行定時任務,整理資訊、管理基礎設施,建構可檢索個人知識圖譜。7、虛擬公司營運:多AI智能體組成24小時虛擬團隊,分工協作,支援彈性擴展。8、ClawdTalk語音助手:通過電話語音與AI助手對話,查詢日程、項目等。9、收件箱整理:自動提取新聞郵件核心資訊生成摘要,根據使用者反饋最佳化篩選標準。10、個人客戶關係管理:自動掃描郵件日曆,建構個人客戶關聯式資料庫,會議前生成參會者背景簡報。11、多管道個人助手:整合多平台功能,通過Telegram管理任務、日程等。12、自動項目管理:自動記錄項目進度和決策依據,無需手動更新,支援自然語言查詢。13、自動化看板:即時監控多資料來源,生成統一面板並自動刷新,異常時傳送警報。14、Todoist任務管家:將AI任務進度同步至Todoist,即時展示工作過程,及時提醒停滯任務。15、多智能體團隊:多專業AI智能體分工協作,自動執行日常任務,平行處理提升效率。16、AionUi桌面AI助手:可與多類AI協同工作,內建部署專家,支援遠端修復。17、自動會議紀要:會議結束後自動生成結構化紀要,識別責任人並建立任務卡片。18、數字員工:平行處理程式碼審查、內容創作等任務。19、個人知識庫(RAG):可將各類連結內容自動匯入,支援語義搜尋快速尋找保存內容,還能對接其他工作流提供支援。20、市場調研與產品工廠:挖掘Reddit和X平台的使用者痛點,自動為這些痛點設計解決方案,助力產品開發。21、預建構創意驗證器:在開發前掃描多平台驗證創意是否存在,生成擁擠度評分、推薦競品及調整方向,把控開發風險。22、語義記憶搜尋:在OpenClaw原有記憶檔案基礎上加入向量語義搜尋,可通過內容含義快速尋找過往記憶,無需手動翻閱。05. 生活篇:制定日程計畫,追蹤健康狀態當然,OpenClaw也可以成為生活助手,幫助你控制智能家電、即時追蹤健康資料、日程提醒等。1、“Claudette”智能家居管家:通過家庭助手控制家中智能裝置,接收指令即可執行,搭建簡單。2、家庭日程管家:彙總全家日曆,自動建立日程、管理食材庫存,生成購物清單。3、樹莓派+WHOOP健康儀表盤:連接運動追蹤器獲取健康資料,還能快速搭建個人網站。4、定製冥想生成器:結合使用者健康資料,生成個性化冥想指令碼和音訊,適配身體狀態。5、每日簡報:結合日曆、天氣、交通資料,主動提醒行程,避免延誤。6、制定早間簡報:每日定時推送定製簡報,涵蓋新聞、任務、積極建議等。7、靈感記錄:隨時通過簡訊記錄筆記、待辦事項,實現記憶捕獲與管理。8、電話提醒:遇到緊急情況時,自動撥打使用者手機告知情況並支援語音交流。9、健康追蹤:記錄飲食和身體反應,分析敏感食物,助力健康管理。10、智能習慣追蹤器:定時提醒使用者堅持習慣,記錄連續天數,每周生成總結報告。11、活動賓客確認智能助手:自動撥打賓客電話確認出席情況,整理完整確認清單。06. 金融篇:24小時“盯盤”,還能模擬交易在金融投資領域,OpenClaw還可以成為投資者的24小時市場哨兵和交易助手。1、預測市場機器人:專注加密貨幣短期預測交易,一周完成1.3萬筆交易,收益11.5萬美元(提醒:結果特殊,需警惕金融風險)。2、加密貨幣“鯨魚”錢包監控器:24小時追蹤巨鯨錢包動向、市場資料,異常情況及時推送提醒。3、股票篩選器:利用免費API搭建股票篩選系統,分析資料並生成交易決策,降低個人投資成本。4、財報追蹤器:自動掃描財報日曆、篩選目標科技公司,財報發佈後快速生成核心資料摘要並推送。5、Polymarket模擬交易員:無需投入真實資金,即時監控Polymarket市場資料,自動執行兩種核心模擬交易策略,追蹤表現並根據歷史資料最佳化參數,推送每日交易總結。07. 結語:OpenClaw應用前景將更加廣闊56個已落地的應用案例顯示,OpenClaw正被開發者和企業用於解決日常效率痛點。上線三個月,GitHub星標超29萬,超越Linux和React;一天之內,騰訊、字節、螞蟻等五家大廠官宣相關服務……OpenClaw的病毒式傳播,恰恰印證了市場對“能用、好用”工具的迫切期待。隨著更多人的嘗試與應用,OpenClaw的應用場景還將繼續拓展。 (智東西)
獲輝達投資背後,諾基亞已經蝶變為AI時代的基礎設施入口
手握通訊底層能力的諾基亞,從一次成功的戰略轉型中,真正站在了AI時代的基礎設施入口。2026年開年,AI圈發生了一件讓很多人看不懂的事。輝達在最新披露的13F持倉檔案中確認,已持有諾基亞約2.9%股份,消息公佈當天,諾基亞股價單日暴漲約22%。與此同時,輝達全額清倉了ARM、Applied Digital、文遠知行等一眾備受關注的明星標的。全球知名的AI大佬,一邊砍,一邊買。砍掉的,是那些看起來“更AI”的公司;買進的,卻是一家很多中國人印象裡已經“死了”的芬蘭老牌子——諾基亞(Nokia)。黃仁勳給出的邏輯是:當AI從雲端走向工廠、城市、車輛、機器人,決定勝負的不再只是GPU,而是算力+網路+基建的閉環。換句話說,輝達缺的那塊,是一個能把AI算力送達物理世界每處角落的通訊底座。而諾基亞,就是那塊底座。1 那場“死亡”,只是一場戰略撤退在很多人印象中,諾基亞似乎是一個扔掉手機業務之後就徹底涼透的過氣品牌,幾乎就是一個眾所周知的失敗案例。這個認知,被誤解的太久了。事實上,如今的諾基亞,不僅是全球前三大5G裝置商,手握超7000項5G核心專利,每年專利授權收入超過100億人民幣,迄今已有超過130個國家在使用諾基亞的基礎設施。旗下的貝爾實驗室,更是走出過11位諾貝爾獎得主,累計專利超過3萬項,持續驅動前沿創新。可以說,憑藉深厚的技術積累、完整的端到端解決方案以及在地緣政治變化中獲得的機遇,諾基亞已成為當前5G領導者華為在全球範圍內最強勁的競爭對手之一。那麼問題來了:一家曾經被媒體宣判死亡的公司,是怎麼發展到這一步的?答案,要從那場轟動全球的新聞說起。2013年9月3日,全球財經媒體的頭條幾乎都是同一條新聞:諾基亞死了。那一天,諾基亞宣佈將手機業務以54.4億歐元,約合71.7億美元,打包賣給了微軟。這個價格,在當時被認為是“跳樓價”。要知道,諾基亞全盛時期市值超過2500億歐元,僅僅十年,竟然跌去了90%以上,連股票都被評級機構標上了“垃圾股”的標籤。那時的全世界都在“哀悼”諾基亞,就連芬蘭的媒體,也使用了各種悼詞式的標題來懷念這個電信巨頭的倒下。這場震動在芬蘭國內是巨大的,畢竟諾基亞不只是一家公司,它在某種意義上是整個芬蘭的國家驕傲,也是這個北歐小國在全球舞台上最響亮的名片。正因諾基亞的“母國”都表現得如此悲傷和茫然,全世界才相信了這場“世紀葬禮”。但沒有人注意到,就在諾基亞跟微軟談判的同一時期,另一筆交易正在悄悄推進。諾基亞以17億歐元,買斷了西門子手中持有的諾西通訊股份(Nokia Siemens Networks,NSN)。諾西通訊股份,其實是諾基亞與西門子合資成立的通訊裝置公司,專門做基站、做網路基礎設施,做的是網際網路時代真正的地基。這家公司彼時已經是全球排名前三的通訊裝置商,覆蓋全球150多個國家的電信營運商網路。而當時的市場估值,給出的數字是34億歐元,這是諾基亞只花了一半的價格,就把西門子手裡那50%的股權全部買了下來。也就是說,諾基亞一邊將自己的手機業務“賤賣”給了微軟,一邊又抄底買下了西門子手裡的股份。當時,諾西通訊的員工數量佔諾基亞總員工數的80%,營運支出佔80%,銷售額佔總營收的80%。】換句話說,那個在媒體上被宣佈“死亡”的諾基亞,只是剔除了一塊已經開始“腐爛的肉”,它真正看重的,從來都不是那部手機。更戲劇性的結局在三年後。2016年,微軟把當年花了71.7億美元買來的諾基亞手機業務,以3.5億美元的價格,又轉手賣給了富智康與HMD Global的聯合體。同一塊資產,三年間,從71.7億美元跌到3.5億美元,價格直接蒸發了將近97%。微軟虧到骨子裡,諾基亞卻早就把錢揣進了口袋,悄悄做著更為宏大的事業。這筆帳算下來,人們才終於明白,之前那場“死亡告別”,不過是諾基亞一次蓄謀已久的“金蟬脫殼”而已。問題來了,諾基亞究竟靠什麼“死而復生”?2 全球通訊的底層規則下的隱形收費者不妨先看一組數字。2021年,諾基亞的專利授權收入是15.02億歐元,約為17.73億美元,而這筆錢佔諾基亞當年總營收的比例只有5.7%。沒錯,5.7%的營收來源,居然撐起了40%的淨利潤,這就是頂級專利的魅力。幾乎沒有邊際成本,每多授權一台裝置,就多一份純利潤流進帳戶。不需要工廠,不需要流水線,不需要售後,每一份授權合同簽下去,錢就開始流進來。這些誘人的數字背後,是一個估值接近150億美元/年的全球5G專利授權市場。身處其中的,都是行業頂尖企業。其中,高通或許是最被熟知的一家通訊企業。其專利授權部門QTL,2024財年全年收入約56億美元,稅前利潤率達到77%,可謂全球最“無本萬利”的生意之一。不過,諾基亞與高通的做法不一樣。高通的專利主要集中在晶片架構和無線通訊應用層,收的是“用我技術造裝置”的錢;而諾基亞的標準必要專利更深,深在通訊協議的底層標準本身——不是“你用了我的設計”,而是“你要接入這張網,就必須經過我設的關卡”。換句話說,如果將高通比作高速公路上的收費員,諾基亞更像是當年那個把收費站坐標寫進所有地圖的人。而這張專利網,是諾基亞用幾十年一針一線“織”出來的。從2G時代開始積累,經歷3G的WCDMA標準,再到4G的LTE,一路走到今天的5G,諾基亞在每一代通訊標準的核心位置,都埋下了自己的專利樁。根據中國信通院2024年發佈的《全球5G專利活動報告》,諾基亞手持的5G核心專利族,佔全球總量的7.6%。這是個很恐怖的資料,按全球通行5G專利費率折算,單台5G終端專利費約2~3歐元。這意味著全球每出貨一台5G手機,無論這台手機是蘋果造的、三星造的,還是小米造的,都要向諾基亞支付3歐元的專利費。2025年,全球5G手機出貨量超過15億台,可想而知這是多麼龐大的天文數字。更關鍵的是,這條專利鎖鏈根本沒有繞開的可能。這裡有一個概念叫“標準必要專利”。通俗地說,就是某項技術已經被寫進了行業標準協議本身——你不是不想繞,是根本沒有路可以繞。就好比高速公路的收費站被直接印進了所有導航地圖,你的每一條路線都經過它,你唯一的選擇,是付錢還是不開車。5G就是這樣一條高速公路,而諾基亞在這條路上設了不止一個收費站。就連中國三大營運商,最終也選擇了與諾基亞簽訂5G專利授權協議。其中,合作的背後也有一段極為複雜的拉鋸戰。中國三大營運商們曾經試圖推動降低專利費率,談判持續了相當長的時間。但結果是,協議還是簽了。原因很簡單:中國從2G建網開始,核心網路裝置大量使用了諾基亞的技術,歷經三代通訊迭代,這些技術已經深度嵌入整個基礎設施,根本無法剝離。不是不想談,是沒有籌碼可以徹底說不。因為,整個地球的通訊神經,早就嵌入到諾基亞的骨頭裡。3 買下人類科技史:貝爾實驗室的價值如果說擁有一張籠罩全球的通訊專利網已經夠厲害了,可諾基亞還不止這些。2015年,諾基亞宣佈以166億美元收購阿爾卡特朗訊。可能很多人對這個公司名字有些陌生,但這家公司旗下有一個叫貝爾實驗室的機構。貝爾實驗室,或許是人類歷史上最密集的智識奇蹟發生地。1947年,電晶體在這裡被發明出來。三位發明者後來拿了1956年的諾貝爾物理學獎。電晶體是整個現代電子工業的基石,沒有它,就沒有晶片,沒有電腦,也就沒有今天我們整個網路世界。1969年,Unix作業系統在這裡誕生。它是今天所有主流作業系統的祖先,Linux、macOS、Android,血脈裡都流著Unix的基因。除此之外,貝爾實驗室還發明了雷射器、太陽能電池、C語言,以及奠定了整個資訊時代理論基礎的資訊理論。這裡先後走出了11位諾貝爾獎得主,5點陣圖靈獎得主,創立以來累計申請專利超過3萬項。說這裡是人類科技史上“最貴的大腦”,相信沒有人會反對。甚至,很多人也忽視了,貝爾實驗室可不是什麼博物館,也不是什麼“歷史遺蹟”,而是一台依舊高速運轉的“科技引擎”。併入諾基亞之後,貝爾實驗室的研究方向直接對準了下一代通訊網路。隨後,貝爾實驗室開始相繼在6G基礎理論研究、AI原生無線接入網、超低延遲邊緣計算架構三個領域全面佈局。貝爾實驗室的目標是讓未來的基站本身就具備AI推理能力,而不只是傳輸資料的管道。截至2025年,諾基亞的5G標準必要專利組合已突破7000項,6G預標準化工作已被業界評為“行業領先”,並成為AI時代新的“鋪路石”。如果還需要一個更直接的證明,就是之前提到的輝達入股諾基亞那件事。輝達為什麼選諾基亞,而不是高通,不是愛立信?答案其實就寫在這筆交易的背後戰略邏輯裡。隨著AI的飛速發展,越來越多的AI需要即時調度分散在全球的算力節點,需要跨越地理邊界的智能網路傳輸,更需要超低延遲的端到端通訊節點。而那個能提供底層通訊協議專利、同時掌握全球營運商基礎設施入口的合作夥伴,就是諾基亞。根據行業預測,到2030年,全球無線接入網市場規模預計超過2000億美元,輝達相當於提前押了一個最重要的位置。換句話說,諾基亞買貝爾實驗室,不是在收藏一段歷史,而是在購買未來。輝達的這10億美元,是對這個判斷最貴的一次背書。這筆收購帶來的市場效應,也是即時的。收購完成後,諾基亞的通訊業務全球市場份額從8%一躍跳到30%,直接成為全球第二大通訊裝置商。這個數字,我們可以用一個類比來感受它的量級:相當於一家地區性小銀行,一夜之間吞併了全國第二大行。規模、客戶、網路、話語權,全部翻倍。此時的諾基亞,已經是一個前所未有的技術合體,包括原諾基亞的通訊積累,加上諾西通訊的全球裝置網路,再加上阿爾卡特朗訊遍佈歐美的管道資源,最後加上貝爾實驗室這台人類頂級的研發引擎。此外,還有摩托羅拉無線業務的遺產、阿爾卡特的技術積累、朗訊的專利矩陣,以及貝爾實驗室的大腦也在裡面。每一個名字單獨拎出來,都曾是一個時代的象徵,而現在統統屬於了諾基亞。4 真正的對手:華為眼中的諾基亞那麼,這樣一個手握貝爾實驗室、捏著3萬項專利的“超級戰士”,究竟在5G戰場上站在那一邊?如今的全球5G基站市場,是一片三家公司的天下。其中,華為38%、愛立信29%、諾基亞26%(資料來源:2024年前後市場統計,此後格局隨地緣政治持續演變,但三家寡頭的基本盤並未根本改變)。三家加起來,大約佔據全球市場的90%以上。可以說,這個行業早已不是什麼競爭激烈的藍海市場,而是一個寡頭格局已經固化的行業。無論誰要建5G網路,基本上沒什麼選擇餘地。可就在這張三足鼎立的地圖上,諾基亞是唯一一家同時拿下美國四大營運商、日本三大營運商、韓國三大營運商5G網路合同的裝置商,沒有第二家做到這一點。與此同時,諾基亞也是唯一一家能在5G網路上做到“端到端全覆蓋”的廠商——無線電、核心網、雲端運算、網路管理、自動化,整套鏈條全部自研,全部打通,沒有短板。這種“全端能力”,恰恰是諾基亞在行業競爭中最難被覆制的優勢。而讓諾基亞真正成為華為心腹大患的,是2019年前後那場地緣政治的劇變。美國開始對華為實施制裁,全球供應鏈對華為關上了門,歐洲和北美的營運商被迫重新選擇合作夥伴,剔除華為裝置,重建5G網路。這是一扇被地緣政治強行打開的大門,也把諾基亞捲了進去。2020年,諾基亞與英國電信簽訂5G協議,成為英國電信最大的基礎設施合作夥伴。緊接著,德國、法國、荷蘭、北歐各國陸續跟進。諾基亞的新訂單在兩年內出現了久違的爆發式增長。顯然,這不是諾基亞靠技術碾壓贏來的,只是靠所謂“在正確的時間,站在了正確的位置”。當然,地緣政治只是時機,真正的護城河,還是那張專利網,而華為並不遜色。因為在專利這張桌子上,華為已經擁有的5G核心專利族佔全球約15%,是諾基亞的兩倍。這也意味著,任何一方想發動專利攻勢,對方都有能力反制。而雙方都握著對方的把柄,誰也沒有“一擊必殺”的能力。這是一種精妙的、建立在實力均衡上的恐怖平衡。2020年,諾基亞曾就專利授權問題向大陸營運商施壓,涉及的正是5G標準必要專利的收費談判,雙方拉鋸了相當長時間。雖然最終的協議細節沒有公開,但結果眾所周知:協議簽了。這就是這場博弈的本質——不是誰徹底打倒誰,而是誰先在談判桌上讓步。可以說,能讓華為視之為真正對手的,這個世界上沒有幾家,而諾基亞是其中之一,原因不複雜:它掌握的資產,華為一樣也繞不開。而從全球5G賽場回到本土芬蘭,這家巨頭的命運,也早已與一個國家的產業根基深度繫結。5 大樹不倒:諾基亞與芬蘭的經濟根基2010年,諾基亞一家公司,貢獻了芬蘭GDP的3%,出口額約20%,以及全國五分之一的公司稅。而這個北歐國家,總人口才500多萬人。這個數字意味著,芬蘭這個國家,在某種程度上,就是諾基亞的“影子”。所以,2013年當諾基亞的手機帝國轟然崩塌時,所有人都以為芬蘭經濟會跟著一起垮掉。可實際上,這一幕並沒有發生。發生的是另一件事。諾基亞的大批工程師、產品經理、設計師,從那艘看似要沉的大船上跳了下來,帶著他們在諾基亞練出來的技術積累和工程思維,開始創業。Rovio做出了《憤怒的小鳥》,後來被日本世嘉以7.06億歐元收購;Supercell做出了《部落衝突》和《皇室戰爭》,2025年單年營收就達30億美元。一家芬蘭遊戲公司,年入30億美元,體量已經相當於一家中型科技公司。而這兩個名字背後,創始團隊都有前諾基亞員工的身影。據統計,赫爾辛基科技生態中,相當比例的創業公司核心團隊,都有諾基亞工作背景。這批人帶走的不只是程式設計技能,還有諾基亞多年培養出來的產品思維、工程規範和全球化視野。大樹倒了,但根系散開,每一條根都長出了新芽。這背後,其實有一個更深的土壤。芬蘭每年的研發支出佔GDP接近3%,高於歐盟平均水平將近一個百分點。這也是一種長期的,不是為某家公司,而是為了整個國家的技術積累能力的系統投入。諾基亞是芬蘭種出來的果實,但這片土地,並沒有因為果實落地就失去了生長的能力。完成戰略蛻變的諾基亞,自2017年以261億美元年營收重回《財富》世界500強以來,已穩固其全球通訊巨頭的地位。根據其2025年財報,公司淨銷售額達198.89億歐元(約235億美元),展現了強大的經營韌性。同年,輝達又宣佈以10億美元戰略入股諾基亞,成為其第二大股東,這絕非一次情懷投資。輝達看中的,正是諾基亞建構的、讓全球通訊基礎設施都難以繞開的完整體系,以及底層標準、核心專利與遍佈全球的網路裝置。而這筆投資也清晰地揭示出諾基亞真正的護城河:它早已不是一家手機公司,而是一個掌控著物理世界資料傳輸命脈的隱形帝國。因此,當AI從雲端走向萬物互聯的實體世界時,決定勝負的關鍵正從單一的算力轉向“算力+網路”的閉環。手握通訊底層能力的諾基亞,由此從一次成功的戰略轉型中,真正站在了AI時代的基礎設施入口。 (礪石商業評論)
20 年生命 vs 2 小時訓練,Sam Altman 開始算「人肉成本」
如果幾年前有人跟我說,「你以後可能會看到科技公司 CEO,用人類的生存成本來為 AI 辯護」,我大概會覺得這是科幻小說裡的情節。但這個看似荒誕的場景,真的發生了。AI 行業最嚴厲的父親不久前的印度 AI 峰會上,Sam Altman 面對 AI 能源消耗的質疑時,給出了一個讓人意外的回應:「訓練一個人需要 20 年的生命和這期間吃掉的所有食物,相比之下,討論 AI 的能源使用是『不公平』的。」這不是簡單的狡辯,而是一種全新的敘事策略——當你的產品被指控太耗能時,不妨算算人類的「訓練成本」。01 「人肉成本」的精妙算計Altman 的邏輯表面上很簡單:一個人從出生到成年,需要消耗 20 年的食物、住房、教育資源,而訓練一個 AI 模型只需要幾個月。從「投入產出比」來看,AI 似乎更划算。這個比較背後藏著一個巧妙的概念偷換。人類的成長不是純粹的「訓練」,而是生命本身。一個 20 歲的人不僅具備了工作能力,還有情感、創造力、道德判斷,以及無法量化的人生體驗。而 AI 模型無論多麼強大,都只是在特定任務上的工具。但 Altman 的比較確實觸及了一個有趣的角度。如果把人類社會看作一個巨大的「訓練系統」,那麼培養一名程式設計師的總成本確實驚人:20 年基礎教育、4 年大學、若干年工作經驗,再算上背後的社會基礎設施投入。有開發者在 Twitter 上調侃:「按這個邏輯,我應該感謝公司沒有直接用 AI 替代我,畢竟我的『訓練成本』確實挺高。」02 從兆承諾到六千億現實Altman 選擇在這個時間點拋出「人肉成本論」,背景頗為微妙。就在幾天前,OpenAI 剛剛大幅調整了財務預期——原本宣稱的 1.4 兆美元基礎設施投入,悄悄縮水到 6000 億美元。這個調整釋放了一個訊號:即使是 OpenAI,也開始正視 AI 訓練的成本壓力。當初豪氣萬丈的兆計畫,在現實的能源帳單面前變得謹慎。與此同時,OpenAI 的商業化步伐在加速。從考慮在 ChatGPT 中加入「Instagram 風格」的廣告,到與 Tata 集團的戰略合作,再到 GPT-5.2-Codex 的發佈——每一步都在尋找更高效的盈利模式,以平衡巨額的訓練成本。Altman 的能源辯論,更像是為這種商業化轉向提供理論支撐。如果 AI 訓練比人類「培養」更環保,那麼大規模投入 AI 就有了道德正當性。如果 AI 模型的能效比人類更高,那麼用 AI 替代人工就不僅是商業選擇,還是環保責任。這場能源辯論的背景,是整個科技行業對 AI 環境影響的集體焦慮。資料中心的耗電量正在以驚人速度增長。訓練一個大型語言模型的碳排放,相當於幾百次跨大西洋航班。當各國政府都在制定碳中和目標時,AI 公司面臨著前所未有的壓力。Altman 的「人肉成本論」,本質上是一種防禦性的敘事策略——與其被動解釋 AI 為什麼耗能,不如主動重新定義「什麼是合理的能源消耗」。這讓筆者想起他在峰會上的另一個表態:需要類似國際原子能機構的組織來監管 AI。表面上是呼籲監管,實際上是在為 AI 的「核能級」影響力做鋪墊:既然 AI 像核能一樣重要,那麼相應的能源消耗就是必要代價。但這種敘事面臨一個根本問題——AI 和人類並不是非此即彼的關係。03 被忽視的第三種可能Altman 的比較預設了一個前提:AI 和人類是競爭關係,我們必須選擇更「高效」的那一個。但現實遠比這個二元對立複雜。AI 的價值不在於替代人類,而在於增強人類能力。一個經驗豐富的程式設計師配合 AI 工具,產出效率遠超純 AI 或純人工。從這個角度看,真正的問題不是「AI 比人類更環保嗎」,而是「如何讓 AI 的能源消耗產生最大價值」。一位能源政策研究者在接受採訪時指出:「關鍵不是 AI 用了多少電,而是這些電有沒有用對地方。如果 AI 能幫助最佳化電網、減少能源浪費,那麼訓練成本就是划算的投資。」OpenAI 最近推出的安全功能和風險標籤,某種程度上也是在回應這個問題——通過更精準的應用,讓每一分算力都用得更有意義。Altman 的「人肉成本論」雖然聽起來荒誕,但它揭示了一個深層次的哲學問題:在演算法時代,我們如何衡量價值和成本?當 AI 能夠在 2 小時內完成人類 20 年才能掌握的技能,傳統的成本效益分析是否還適用?當機器學習的邊際成本趨近於零,人類勞動的價值該如何重新定義?這些問題沒有標準答案,但不能迴避討論。從印度 AI 峰會上 Altman 與 Anthropic CEO Dario Amodei 拒絕握手的緊張場面,到關於 AI 廣告的口水戰,再到如今的能源辯論——每一次爭議背後,都是對 AI 未來形態的不同想像。Altman 選擇用「人肉成本」為 AI 辯護,實際上是在重新界定效率的含義。但效率從來不是唯一標準,還有公平、可持續、以及我們想要生活在什麼樣的世界。當科技 CEO 開始計算人類的「訓練成本」時,也許我們該問的不是這筆帳算得對不對,而是:我們是否願意生活在一個把人類當作「低效 AI」的世界裡。 (極客公園)
高盛:記憶體荒將持續2年,這些領域將迎來超級周期!
供給收縮與AI需求剛性碰撞,儲存產業鏈格局正在重塑。高盛最新專家網路研討會獨家紀要出爐!我們與AI基礎設施供應商Micro Data Center首席技術與AI官深入對話,為您揭示當前AI基礎設施建設熱潮中鮮為人知的核心矛盾與投資機會。核心結論直擊要害:DRAM供應將緊張至少兩年:AI需求激增疊加頭部廠商供給紀律,導致全行業進入結構性稀缺階段。AI買家“不惜代價”:為保障GPU按時交付,資料中心營運商願意承擔更高記憶體成本。瓶頸不止記憶體:從電力、冷卻到網路,整個資料中心基礎設施面臨長達數月至數年的積壓挑戰。01 未來兩年:DRAM持續短缺,價格高位運行高盛報告明確指出,IT硬體行業正進入一個結構性稀缺階段。AI基礎設施需求引爆了記憶體市場的巨大供需失衡,DRAM和NAND的交貨期已長達數月,堪比疫情高峰時期。高頻寬記憶體(HBM) 尤其受限,因其封裝複雜且良率爬升緩慢。造成這一局面的兩大核心原因:需求端:AI訓練與推理對記憶體頻寬和容量提出前所未有要求,HBM需求井噴。供給端:三大行業巨頭SK海力士、三星、美光展現出高度供給紀律,嚴格控制產能投放。這種稀缺對低端消費電子及非AI領域的衝擊尤為顯著,它們正陷入艱難爭取產能分配的境地。市場模式已悄然轉變:買家更傾向於簽訂長期協議,核心訴求已從價格轉向採購量承諾、優先獲取權和分配保證。專家預測,這種供應緊張和價格高企的局面將至少持續未來兩年。02 成本讓位於交付:AI基礎設施買家的“鈔能力”邏輯面對不斷上漲的記憶體成本,AI資料中心的買家選擇出乎意料——照單全收。核心邏輯在於:對於營運商而言,GPU部署延遲的風險遠遠大於記憶體成本的增加。AI模型的訓練與上線時間窗口至關重要,延遲意味著巨大的機會成本與競爭劣勢。為了部分避險成本壓力,行業正在探索 “降配”最佳化 方案,例如:重新設計供電系統部署更具針對性的冷卻基礎設施最佳化網路架構另一方面,面向企業級的OEM廠商(如戴爾Dell)則可能採取不同策略——提高部署服務價格或融資利率,將更高的元件成本分攤到其3-5年的長期服務合同中。這意味著,終端使用者可能以另一種形式為這場“記憶體荒”買單。03 隱藏的瓶頸:AI資料中心的全面供應鏈挑戰記憶體只是AI基建難題的冰山一角。報告揭示,多個關鍵資料中心物理基礎設施元件面臨更長期的“卡脖子” 問題,積壓期從數月到數年不等:電力渦輪機、變壓器、電源單元先進製造先進封裝冷卻液冷元件、風扇連接光開關與光纖、網路卡(NIC)、機箱為了拓寬供應,部分供應商正考慮引入中國供應商(如CXMT長鑫儲存、YMTC長江儲存)進入中低端和亞太市場。然而,由於缺乏有競爭力的HBM產品,高端AI生態系統預計仍將牢牢繫結於目前供應受限的現有市場領導者。04 投資視角:關注點與風險提示綜合報告觀點,以下領域值得關注:潛在受益方(產業鏈關鍵環節):儲存原廠如SK海力士、三星、美光,供應紀律強化有望維持其利潤水平與議價能力。高端儲存相關技術/裝置商受益於HBM等先進封裝的複雜性和高需求。資料中心關鍵基礎設施供應商涉及電力、先進冷卻、高速互連等短缺環節的公司。需謹慎觀察的領域:嚴重依賴成熟製程儲存晶片的低端消費電子領域可能面臨長期的產能擠壓和成本壓力。無法切入高端AI生態的替代供應商在當前的性能競賽中,短期內或難以撼動現有格局。 (數之湧現)
華為打造“最強超節點”,這項全球領先技術很關鍵
2025年以來,超節點(SuperPod)作為新的AI算力基礎設施,不斷成為行業焦點。觀察者網也曾深度報導過華為的昇騰384超節點,它通過高速互聯匯流排將384顆昇騰晶片連接起來,在超節點算力規模、網路互聯頻寬、記憶體總頻寬等多個指標上,趕超了國外廠商的旗艦超節點。但當時一些討論認為,華為是靠堆砌了384顆晶片,才超越了輝達72顆晶片,而後很多廠商也跟進了超節點的概念。一時間,算力行業掀起了建設超節點的熱潮。那回到最初的問題,超節點就是單純的堆晶片嗎?華為是通過暴力堆砌晶片趕超輝達的嗎?超節點和傳統的計算叢集區別在那?關於這些行業熱點話題,華為計算產品線行銷運作部部長張愛軍近日在一場媒體沙龍上對觀察者網等媒體做了詳解。他首先認為,今天的算力需求遠未被滿足,無論是大模型進入到生產系統中,還是在toC消費端,token消耗的數量都在指數級增長,未來中國每日token消耗量可能突破千兆。在一些觀點看來,算力缺口大可以通過大量建設伺服器叢集堆卡來解決。這麼說聽起來有一定道理,但真實情況遠沒有這麼簡單。根據Meta公佈的論文,萬卡叢集訓練時算力利用率僅約38%,粗暴堆卡可能會造成62%的算力浪費,並且模型訓練會3個小時中斷一次。這是因為,叢集網路通訊已成為當前大模型訓練和推理的最大挑戰。以DeepSeek這種混合專家模型(MoE)為例,每個“專家”如果不能有效溝通,NPU就會由於沒有足夠資料計算而閒置,進而形成1+1<2的結果。換句話說,如果384顆昇騰晶片簡單疊加,計算效果就會和普通伺服器叢集一樣效率低下。超節點就在這種情況下應運而生,它不是修補式改進,而是對傳統計算架構進行重構。張愛軍對觀察者網表示,超節點從傳統以CPU為中心的架構,變成了全平等互聯,無論是CPU、NPU還是記憶體單元,都不用再經過CPU,而是可以平等互聯,提高通訊效率,同時連接計算單元的“高速公路”也發生了變化,由全新的協議和匯流排能力來支撐裝置間互聯。現在市面上的超節點越來越多,但並沒有統一標準,而張愛軍認為,真正的超節點須具備三個關鍵特點:一是頻寬夠大,核心要讓計算不用等待通訊;二是有足夠低的時延,傳統叢集很難做到時延降低;三是形成有效的、邏輯上的單一系統,關鍵在於記憶體能不能統一編址。利用這些技術,超節點可以讓DeepSeek的256個“專家”分佈到每個計算單元上,提升吞吐效率。“為什麼要有統一記憶體編址的技術才能真正稱得上超節點?”他進一步對觀察者網解釋稱,傳統叢集的資訊傳遞,跟現實生活中寄快遞的方式比較像,需要做相應的轉換才能找到下單地址。而超節點希望像在圖書館裡檢索書籍一樣,提前進行書籍編址,能快速找到,而且可以變成資源池。如果沒有統一記憶體編址,就不能做到記憶體的池化。如果沒有記憶體池化,計算單元之間的資料快速交換很難做到。如果不能快速交換資料,計算效率是很難提升的。這是為什麼說做不到統一記憶體編址,超節點是很難真正高效地運行起來的原因之一。”一句話總結,超節點相比傳統叢集最大的優勢,是計算效率的顯著提升。以晶片製程為例,在摩爾定律放緩的情況下,7奈米到3奈米,可能每代性能提升不超過20%。而超節點可以將模型算力利用率從30%提升到45%,相當於提升了50%,通過資源的高效調度,在一定程度上可以彌補晶片工藝代差。但打造一個真正的超節點遠沒有那麼容易。關注技術細節的人可能會發現,華為的昇騰384超節點是由12個計算櫃和4個匯流排櫃構成,體積龐大,而輝達NVL72系統只有一個機櫃,為什麼輝達不連接更多機櫃,進而連接更多晶片?核心在於超節點架構不同,輝達採用的全銅線架構,傳遞的是電訊號,而華為將光通訊技術應用於超節點,採用超高速光模組連接。“如果用電的方式,高速訊號基本只能在一個機櫃裡兩到五米傳送,這也是為什麼很多業界的超節點只能在一個機櫃裡面提供。為什麼華為可以跳出單個機櫃限制,規模商用384個晶片互聯,未來可以支援8192個晶片互聯,核心是我們用了光的技術。”張愛軍對觀察者網表示。但“光”並不好駕馭。光模組成本高,也比較嬌慣,如果有灰塵,有各種各樣的溫度變化,容易發生閃斷、系統不穩定,要做的像電一樣可靠,像光一樣長度,難度很大。“我們是怎麼做到的?一句話,系統化創新,華為可以做自己的晶片,有自己光的器件能力,有自己的底層協議,在過去光通訊上建構了工程能力,我們做到了借助全光互聯提供超節點。為什麼其它廠商做不到?就是因為他們或許掌握了某些單點技術,但很難像華為一樣有系統化能力,這也得益於過去華為一直在通訊領域深厚的積累。過去20年,我們在光上面是全球第一的技術積累。”張愛軍對觀察者網說道。華為不僅在做智算超節點,也在發展通算超節點。去年的華為全聯接大會上,華為輪值董事長徐直軍發佈了基於鯤鵬950處理器的TaiShan 950超節點,這是全球首個通用計算超節點,將在2026年一季度上市。他當時表示,TaiShan 950加上分佈式GaussDB資料庫,將徹底取代各種應用場景的大型機和小型機,以及Oracle的Exadata資料庫伺服器。“大家過去買伺服器,主要關注CPU的主頻和核數。但今天大量的場景通過調整主頻和核數是難以解決的,核心原因是因為摩爾定律已經走到頭了,物理的效能很難,堆再多的核、提升再高的主頻,很難把計算效能提升上去。有一條新路,通過通訊的能力把多核能夠連接起來,形成有效的業務系統,同樣給通用計算提供相應的能力。核心和智算是一樣的,提供超大頻寬、超低時延、進行統一記憶體編址。”張愛軍說道。在華為的思考中,無論是智算還是通算超節點,乃至像Atlas 950 SuperCluster這樣數十萬卡的巨型超節點叢集,核心是要讓大量伺服器像一台電腦一樣工作,由此華為建構了新型互聯協議靈衢UB(UnifiedBus),並將靈衢2.0規範開放。“靈衢是建構超節點的核心能力,華為把它完全開放出來,讓業界所有的人都可以獲取到這個技術。基礎協議有600頁,是所有廠商中提供的最詳細、最完整的能力。通過對靈衢2.0協議的開放,產業界夥伴能夠借助這個技術打造自己的超節點。我們希望與產業界共創,能夠形成一個繁榮的產業生態,希望這些新的能力、新的技術不僅僅華為在使用,而是整個產業鏈一起來建構。”張愛軍表示。超節點足夠火熱,但支撐其運行的不只有晶片、光模組等硬體,還有大量軟體生態,比如異構計算架構CANN、作業系統openEuler、資料庫openGauss、AI框架MindSpore等等。生態需要產業共建,華為一直堅持軟體開源開放。張愛軍表示,“目前鯤鵬註冊開發者有380萬,昇騰有將近400萬開發者。2025年8月,我們把CANN完全開源開放,openEuler也是業界第一個面向超節點的開源作業系統。特別是CANN,我們從最底層的營運時,到開發語言、範本庫\算子庫等,完整地開源給產業界,現在已經有很多開發者基於昇騰CANN的能力,自己開發算子,來面向它的業務場景進行創新。AI 時代的迭代速度遠超以往,單打獨鬥很難跟上節奏,協同共創、開放共生才能共贏未來。” (觀網財經)
財報 vs 市場預期:微軟是 AI 贏家、還是估值透支的未來賭注?
FY26Q2核心財務資料- 2026 財年第二季度總營收達 812.73 億美元,同比增⻓ 16.7%,驅動核心為雲服務收入增⻓ 26%至 515億美元,AI 驅動的雲業務持續高增⻓。- Azure 與雲服務收入同比激增 39%,帶動服務與其他收入達 648 億美元,貢獻超 80%營收,雲業務成為核心增⻓引擎。- 淨利潤 384.58 億美元,同比大增 60%(但 GAAP 利潤受 OpenAI 投資虧損拖累,調整後淨利潤 309 億元,增⻓ 23%)- 成本端,服務與其他成本同比上升 25.2%至 224.73 億美元,主要源於資料中心擴張與 AI 算力投入,但毛利率提升至 68.0%(上年同期 68.7%),顯示規模效應與營運效率最佳化。營運利潤 382.75 億美元,同比增⻓20.9%。市場質疑· 資本支出的黑洞風險- 本季度資本支出高達 375 億美元,同比暴增 66%,多用於 GPU 與資料中心;- 投資者質疑: 若 AI 硬體使用周期短於服務合同期限,折舊壓力可能侵蝕利潤,形成“期限錯配”;    - 與 Meta 將 AI 基建表外化不同,微軟選擇全額表內折舊,導致雲業務毛利率下滑,引發盈利質量擔憂。· 對OpenAI依賴過重- 微軟 6250 億美元的商用預訂義務中近 45%與 OpenAI 繫結;- 如果 OpenAI 在技術及治理上失誤,微軟 Azure 將面臨“失速”⻛險,市場開始質疑其 AI 增⻓基石的穩固性。業績指引· 短期業績指引(FY26Q3)營收: 預計 FY26Q3 營收為 806.5-817.5 億美元,同比增⻓ 15%-17%。毛利率: 預計毛利率上限為 67.4%,同比下滑 1.3 個百分點。利潤: 經營利潤指引上限為 373 億美元,同比增⻓ 17%;淨利潤指引上限為 308 億美元,同比增⻓ 19%。· FY26全年業績指引資本開支: FY26 全年資本開支預計繼續擴張,但增速可能低於 FY25。管理層表示,資本開支將根據地區電力和空間資源合理規劃,AI 相關總產能預計同比提升 80%以上。⻓期增⻓驅動:微軟預計 AI 驅動的雲服務(如 Azure)、生產力工具(如 M365 Copilot)和企業服務將繼續推動增⻓。估值· 樂觀情境下的長期邏輯1. 從“軟體巨頭”向“AI 基礎設施擁有者”轉型- 自建資料中心、電力與供應鏈形成算力護城河,⻓遠看可實現邊際成本優勢;- 微軟憑藉低融資成本,有能力低價建構“AI 電網”,對抗未來算力成本通膨;- 相比“租賃算力”的輕資產模型,微軟選擇以時間換空間,建構競爭壁壘。2. 多元模型戰略+平台化佈局- 微軟正擴展 AI 模型合作(如與 Anthropic 合作引入 Claude),擺脫對 OpenAI 的單一依賴;- 推進 Copilot 商業化已滲透至 1500 萬使用者,當前佔比僅 3%,未來潛力巨大;    - 微軟生態系統(Windows,Office,Azure,LinkedIn)天然具備AI產品融合優勢,形成“應用+基礎設施”一體化護城河。 (貝塔投資智庫)全球股東持倉資料來源:Wind整理